Abbiamo visto una delle due applicazioni principali delle memorie associative, il TLB. Oggi vediamo la seconda applicazione più importante: la memoria cache.

In generale la velocità di un processore è molto di elevata di quella di una memoria RAM, poiché è una memoria dinamica, il che le da dei tempi di accesso più lenti rispetto ai registri in memoria statica del processore. Mentre la Cpu prende pochi nanosecondi per accedere ai registri, per accedere alla RAM servono qualche decina/un centinaio di nanosecondi. Per via di questa disparità si introducono le memorie cache.

![](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAdQAAAEGCAIAAABTs/MfAAAAAXNSR0IArs4c6QAAAAlwSFlzAAASdAAAEnQB3mYfeAAAE9NJREFUeF7t3TtWI0fDBmD41wIO5ngFYgUwiaNJv0yEM4kzh86cQDhkTh05MawAVuAzgcVe+FutlhBSt9R1kdQqPUT2UFVd9VTx0lRfdP729nbmiwABAgT2K/B/+z2coxEgQIDAVED4WgcECBA4gIDwPQC6QxIgQED4WgMECBA4gIDwPQC6QxIgQED4WgMECBA4gIDwPQC6QxIgQED4WgMECBA4gIDwPQC6QxIgQED4WgMECBA4gMC5x4sPoO6QBQmcn58XNJrDDOU0U8iZ72FWm6MSIHDiAsL3xBeA4RMgcBgB4XsYd0clQODEBYTviS8AwydA4DACLrgdxt1RixFYueB2mteOQmcTWiXmzDd02ShPgACBDALCNwOiJggQIBAqIHxDxZQnQIBABgHhmwFREwQIEAgVEL6hYsoTIEAgg4DwzYCoCQIECIQKCN9QMeUJECCQQUD4ZkDUBAECBEIFhG+omPIECBDIICB8MyBqggABAqECwjdUTHkCBAhkEBC+GRA1QYAAgVAB4RsqpjwBAgQyCAjfDIiaIECAQKiA8A0VU54AAQIZBIRvBkRNECBAIFRA+IaKKU+AAIEMAsI3A6ImCBAgECogfEPFlCdAgEAGAeGbAVETBAgQCBUQvqFiyhMgQCCDgPDNgKgJAgQIhAoI31Ax5QkQIJBBQPhmQNQEAQIEQgWEb6iY8gQIEMggcP729pahmRKbOD8/L3FY72My9Vnmd2WdUO2jCq1ScubbZ6koQ4AAgcwCwjczqOYIECDQR0D49lFShgABApkFhG9mUM0RIECgj4ALbp1K5V0TKG9EfZb4rstQjRCG5oJbxLJRhQABAhkEbDtkQNQEAQIEQgWEb6iY8gQIEMggIHwzIGqCAAECoQLCN1RMeQIECGQQEL4ZEDVBgACBUAHhGyqmPIFdCTzdVrdgbfy6urq6vX963dqBRUtX95sKv95fnU+bvK0a3drq69P9/e1tVfzq/PZpaw8U2C5QvQfEV6vAil0BSuWNaAiTklH1cbz9B3ZWYvw42TD2yd1o0dDobkPJ5YJnG0u+fSg6fkyUz4iW2JMDVnfm23e5K0dgTwKd0TaZPI5nsfpw87/uU9rXf/56mQb0eJrlL9/+2HqaOhpNW33565/us+SmzT0JnMZhhO9pzLNRliBwcXH9/fltdn7cHapNTo4+/fpLXfLh763p++VLndPd6TtrczRusr8EzMOPQfhmn4Nqa2y6Mfa+dbdpn27jLl97xek+XfW1fTNva6HsQ9fgPgSuf53tKvz7X+uJ6jx7v3y+uO6dvp/rkp3p22Tvl18+7WOAp3IM4Ztxpl+fbqtcvLz59vDyMv27r/mq/ufh283leXWpZPuVkuXuLCoG1ss4JE0NV+Dlx6Slc09/fJuuvVGVvWdn8/T9fesKmpXsSN959n6+HK7GEfZM+OaatOqE9PLmoV7347vHyftVjmqj7q7+a62K4MuO89X2ax1VxfoU5+Xbhg2+XP3XztEITH7Uv9pHn1qy8Onvh/p7dfYu0nfjdu5s3BvSd5G9dZO+cgkI3zyST7eXsxOO6try8/ev1xfv67TaqPv6/bm6VDLL0cv+t+lUFZ+3bfDl6b5Wjkfg9f73Ol/Pfv5pPQxXsjdL+sreHS0O4ZsD9un2pv55GD8+f+04O6gulTQ3Ej1s/xtwqU/zDb4eV01yjEQbAxZ4rS8nzH7LV7/mf71e6+ta9r6n7/abHjrOfWXvrpaE8E2XnZ+KjB+/r/84rOdotZMwCdj7vfjp57qNjssr6d3XwtAEHm7aH7S4rC8nzJJ30vZrvsne8W/LpwDNvm+Pmx4uP7XccTbbQ55vYwyN6qj7I3yTp29+B+T4l43RWx3n4utzdUv383O1K5F8VA2cpMCovqDw1voH1uIkYGUh9v7j6eLzl7X0neW57N3FahO+yaqbLn8kN3529vrfv3UrbTt8GZrXxPAEVh6yWDxZUV3K/e3P6QWF1i53nwQ0oXq2dcNrPX2bc2mLbxerRPimqu44HJs7h862n1enDkT9gQpMn6yYPdz78nDTdb/M2eIRtJZNi2abePMzbNPRr6bvfB9j6x91A6UbdreEb6b5ab3vJ63t+vLK7Epe69WVtNbVPiaBasequV7bcb9Mv8d/t95y9jF9Ze9O14jw3Slv38arn6j1ayzzyyujDTdR9D2AckcvsLhdpnqxw9rtios9h6433jTvxdn6pofl9JW9u100wjeTb/vjRkmNV687qR/XeN58E0XSMVQ+IoHu+N2+OTXf991608M8fX9MZO+O14bwTQXOcitY6xNuz88rj2ukdlX9YxfoiN8mJjdeGAhN34eb5t51+727WjXCN1m2uY+y16nv9D06PV+Hva1fm4/X3IKxrRHfPzaBtvjtk73TGx1/m70ueNtND/PTibqwC727WyHCN922/7uj6p+S6jU7P84SbvT98LPR0fsd34KRbqaFaIGl+J09K9kve6uC88cttl12m5eTvdGT1Kui8O3FtLnQPH3Xr4N8qLd4KD/xbGL2INLGzbsd33ucwUwT8QKL+K3fuNQ7eyPSN3Glxg/xNGoe8FM0Bn7olfnf3Nv5B8B0fhRL82Kd6cnE8gXppt7mT3BZPfTiE106PvJg/v3VVoNGNPDZGU73qEbMBbQKzZlvnt+x05OR+jb46p6x+iMO39/eUL0OpXq5evW6yemRqtvG0u9duPj65+xdkw8368davHpldPdn11t+8oxZKwQIpAhE/NY6kSrhv5wns/f2dn1VN46tfZZh1JlvPQHzT/NqP1rrqXT4iE5kqpOGSTWCD5oz35RfW+t1L6r39r5NX50+rj+QcP7V3K87fc9vwnW21cNNP82rfk372rGmb3LvfLVl3hFrjQCBWIHzKoBj6xZer3rkbHmEBUCVN6IhLEGqEbMArUKz5xuxclQhQIBAqoDwTRVUnwABAhECwjcCTRUCBAikCgjfVEH1CRAgECEgfCPQVCFAgECqgPBNFVSfAAECEQLCNwJNFQIECKQKCN9UQfUJECAQISB8I9BUIUCAQKqA8E0VVJ8AAQIRAsI3Ak0VAgQIpAoI31RB9QkQIBAhIHwj0FQhQIBAqoDwTRVUnwABAhECwjcCTRUCBAikCgjfVEH1CRAgECEgfCPQVCFAgECqgPBNFVSfAAECEQLCNwJNFQIECKQKCN9UQfUJECAQISB8I9BUIUCAQKqA8E0VVJ8AAQIRAsI3Ak0VAgQIpAoI31RB9QkQIBAhIHwj0FQhQIBAqoDwTRVUnwABAhECwjcCTRUCBAikCgjfVEH1CRAgECEgfCPQVCFAgECqgPBNFVSfAAECEQLCNwJNFQIECKQKCN9UQfUJECAQISB8I9BUIUCAQKqA8E0VVJ8AAQIRAsI3Ak0VAgQIpAoI31RB9QkQIBAhIHwj0FQhQIBAqoDwTRVUnwABAhECwjcCTRUCBAikCgjfVEH1CRAgECEgfCPQVCFAgECqgPBNFVSfAAECEQLCNwJNFQIECKQKCN9UQfUJECAQISB8I9BUIUCAQKqA8E0VVJ8AAQIRAsI3Ak0VAgQIpAoI31RB9QkQIBAhIHwj0FQhQIBAqoDwTRVUnwABAhECwjcCTRUCBAikCgjfVEH1CRAgECEgfCPQVCFAgECqgPBNFVSfAAECEQLCNwJNFQIECKQKCN9UQfUJECAQISB8I9BUIUCAQKqA8E0VVJ8AAQIRAsI3Ak0VAgQIpAoI31RB9QkQIBAhIHwj0FQhQIBAqoDwTRVUnwABAhECwjcCTRUCBAikCgjfVEH1CRAgECEgfCPQVCFAgECqgPBNFVSfAAECEQLCNwJNFQIECKQKCN9UQfUJECAQISB8I9BUIUCAQKqA8E0VVJ8AAQIRAsI3Ak0VAgQIpAoI31TBoPrn86+gWgoTIFCegPDd35xWwbs42PJ/768HjkSAwGAEzt/e3gbTmWF1pPh8NPVZFtzKOqHaRxVapeTMt89SUYYAAQKZBYRvZlDNESBAoI+A8O2jpAwBAgQyCwjfzKCaI0CAQB8BF9z6KG0p0/PqQc9iGTqkiT0KmNYIbGguuEUsG1UIECCQQcC2QwZETRAgQCBUQPiGiilPgACBDALCNwOiJggQIBAqcNIX3Ip/hi10NXg6K1SsKu/aEbQIARfc4tDUIkCAQKqAbYdUQfUJECAQISB8I9BUIUCAQKqA8E0VVJ9ASQJeOb232XTB7Z36BC83uViU/pNWkuHexrK3A6XP7+5acOa7O9uEll/vr+ozkNunhEZUJUBgwALCd8CTo2sECJQrIHzLnVsjO4TAYs/0GP9jBWx3QzjEzAzumMJ3cFOiQwQInIKA8D2FWTZGAgQGJyB8N03J69Pt1ezK1/Tr6vb+6bW1+Ovr031V8r1oVbi79FnfZmfHqtte9GFTsyvtbig6uHWoQwROT6C6v+pkv1Zm+6PD5G7UthpGd5MVr8dxa8FZ5fHjSul+zc5Ljcetja+1+vbW2Yv1Di/1aKPAya6LsIGfXmbkH3GYeCmlz0oZSMw4NkTP47j55ujucZa2k/k/fUyz939tytVlq8LzRP4QlH2bXY7o0fhuMu/C4hfCx/hdFF/0dtqHu3kfWrK64RK+MevmeOqEzm9o+eORGGJPhe/7enufn3mYrZw1Ls5HF6ez6/+yaKSljd7Nvr2H72pwzuN76d/fO7F6Ul6dD9fD6zz79cM2xB/KfH0Knd/Q8vl6eootCd+W8O2M1A1Zu7541oIvoNmOmJ4epGn2PXybsh0Bu1b8Q0f9sJX9Qx86v6Hly9bb9ehccGvZwJr8eKn3a3+5XvnmxdfnekK+r35jUe61uvb2VF0hqy6R3Tys1I5o9uefLjo22P79r7n29/rPX9Pejr58bi16+ane/1gUz79fp0UCBGIEhO+62ut//4ZRzu51qG9IuLy8vLm5+fbwUMf3h6/gZvt1oon0l2+XrbfEX36re/LyY9KvOaUIENiPgPDtdB59uuwzB0+355dV2r4s0nY0Go+rq3SLC3QrjfRsts+hlSFA4HgFhG/n3PU5WaxegDPbXahuSajytt6TeH7+/v3r9UXXfkGfZiPW08Y7yjbulEQcTBUCBJIFhO864cVPP3e5rrxtrNlvre7mfV7L27Vdhv7NBs1qs6m7o0wP6orCBAj0FxC+LVZNnj38vfZCx2aDdb51sPK/y03Nc3np33o323/6qpLzTG/pbVA7ChMgsFcB4dvCffH5S32LwMPv9x8eJ369/73eYxj/9nW2qdB91vn0x+xC1/JX72bDVsD1r7NHLx5uWt7+68XAYZhKE9ifwK7vZRty+yvKy11dPLg2nj+4tnhobXl3df2JtfpRuA/PGy8/JtGz2cVDFq3PEdfd/rDH+96N6dZzM46lx+w8ZDHkZbjDvm1Y4a1HDS2/w66fQNMesnhfbx+nu99LGObPPKz+tpxegGueBf6YfP2a3fA0R/tDa6uJv9SfUffTxW9+2Mr+GQ+d39DyZevtenS2Hbr+yJg+UDGNtMVZbHULWXVW+dzsOMyrXX//WOqsKladfU4vwDWbFx8vhfVsNvRPn4vr78+Tx+ptDksn3aO6x1VXOh8JCT2K8gQIZBPwAZofznyzuR5JQz7H8EgmKrKbofMbWj6yW6rVAs58LQQCBAgcQED4HgDdIQnsQWDlNHYPR3SIIAHhG8SlMIFjFaguHx1r1wvtt/AtdGINiwCBYQsI32HPj94RIFCogLsdCp3YqGH5yzSKbaCVIm5diKgy0MEfQ7ec+R7DLOkjAQLFCQjf4qbUgAgQOAYB4XsMs6SPBAgUJyB8i5tSAyJA4BgETvqCW64J6nmZomexXL3SzokLRKy3iConjpwyfGe+KXrqEiBAIFJA+EbCqUaAAIEUAeGboqcuAQIEIgWEbyScagQIEEgREL4peuoSIEAgUkD4RsKpRoAAgRQBt5ql6DV1vTg1A6ImhifgXR87nRNnvqm8kjdVUH0CJykgfE9y2g2aAIFDCwjfQ8+A4xMgcJICwjd12u2LpQqqT+AkBVxwyzDtnojPgKiJAQhYyfucBGe++9R2LAIECDQCwtdSIECAwAEEhO8B0B2SAAECwtcaIECAwAEEhO8B0B2SAAECwtcaIECAwAEEhO8B0B2SAAECwtcaIECAwAEEhO8B0B2SAAECwtcaIECAwAEEPF4cj+5lkvF2ah6DgPeW7HSWnPlG8kreSDjVCBCoBYSvhUCAQIuA095dLwvhu2th7RM4PgHJu4c5E76RyFZnJJxqgxewtvczRS645XFebAFbuHlAtUKgdAHhW/oMGx8BAoMUsO0wyGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShcQvqXPsPERIDBIAeE7yGnRKQIEShf4fyQKf2bcU8zkAAAAAElFTkSuQmCC)  
Le memorie Cache sono interposte tra il processore e il BUS dati, sono realizzate con una tecnologia simile a quella del processore, inoltre sono molto più vicine fisicamente al processore della RAM.

Le memorie cache usano quindi la tecnologia statica, che però ha lo svantaggio di non poter essere usata per grandi memorie (infatti le cache sono più piccole delle RAM). L’obiettivo della cache è quella di conservare delle porzioni/sottoinsiemi del contenuto della memoria RAM, che variano a seconda dei bisogni del processore: questo causa un sostanziale risparmio di tempo nell’esecuzione dei programmi.

I principi su cui si basa la memoria Cache sono i principi di località: nel tempo e nello spazio. Dunque, se il processore sta usando una certa pagina di memoria è probabile che nel prossimo futuro continui ad usarla, così come è probabile che userà celle vicine all’ultima usata.

Linee di cache(?) cerca su google.

Il trasferimento dei dati dalla RAM alla Cache viene gestito in maniera completamente indipendente dalla cache stessa. Essa è costituita da linee di Cache, in cui una porzione è dedicata al campo Tag (tipica delle memorie associative) e diversi (uno, due o più) campi per i valori contenuti nelle celle memoria a cui punta.

Supponiamo di avere una memoria RAM di 2^30 byte organizzate in parole da 32 bit. In totale ci sono 2^28 celle di memoria, i cui indirizzi vanno espressi su 28 bit. Utilizziamo però 27 bit per il campo Tag, in quanto prendiamo due celle per linea di cache.

Ipotizziamo che il processore abbia generato l’indirizzo 1000. Il controllore della cache andrà a guardare due celle: quella di lunghezza 1000 e quella di lunghezza 1001. A questo punto il contenuto della cella 1000 viene salvato nella prima cella data, mentre quello della cella 1001 viene salvato nella seconda cella data.

Nel nostro esempio abbiamo aggregato due celle consecutive in una linea di cache, tuttavia potremmo anche aumentarla a 4. In questo caso la dimensione del campo tag si ridurrebbe a 26 bit. All’aumentare della dimensione della linea di cache sfrutto maggiormente la località nello spazio. Tuttavia la località nel tempo viene invece sfruttata utilizzando un algoritmo di sostituzione (LRU = less recently used).

Abbiamo nella cache una certa quantità di linee (ad esempio 8), che possono essere usate in maniera indipendente l’una dall’altra. Esse si riempiono una per volta copiando n celle della RAM per linea di cache. Quando si è arrivati ad utilizzare tutte le linee di cache e il processore chiede un indirizzo diverso, l’algoritmo LRU prevede che ci sia una sostituzione: la linea usata per ultima viene svuotata e viene riempita dal gruppo di celle di cui il processore ha bisogno.

Tutte queste operazioni sono realizzate a livello hardware: per questo, onde evitare che diventi tutto troppo complicato, si evita di applicare con rigore l’algoritmo LRU (perché richiederebbe troppi bit e troppa energia per contare il tempo di inutilizzo di tutte le linee di cache e poi confrontarli). L’algoritmo si implementa in versione approssimata, riducendo la rappresentazione del tempo di ultimo accesso a un solo bit, che (parte al valore 1 al momento del caricamento della linea, che) viene resettato a 0 da un timer di tanto in tanto e che viene reimpostato a 1 quando la linea viene utilizzata nuovamente. Così la Cache decide di sostituire una qualsiasi delle sue linee che abbia il valore 0 a quel bit. Non è un meccanismo perfetto (può capitare che la cache sostituisca una linea che il processore stava usando perché per sfortuna i bit si sono resettati un istante prima), tuttavia è un metodo molto migliore rispetto alla sostituzione casuale.

Un secondo modo per ridurre la complessità circuitale e ridurre i costi è quello di cercare alternative all’uso di una memoria associativa (perché ogni linea richiede non solo un campo tag ma anche un circuito comparatore). Quindi, vediamo l’organizzazione interna della cache:

* la prima alternativa è quella completamente associativa (ogni linea ha il suo campo tag e il suo circuito comparatore, la ricerca avviene su tutte le linee contemporaneamente)
* la seconda è la cache a corrispondenza diretta (c’è un solo campo tag, che vale per TUTTE le linee di cache; in questo caso il campo tag è ridotto e nel nostro esempio di prima conterrebbe meno di 26 bit, i bit rimanenti vengono usati per determinare una linea all’interno del nostro dispositivo Cache. Se per esempio ci sono 16 linee, gli ultimi 6 bit vengono usati per determinare una delle linee e la posizione nella linea). Facciamo per esempio che il processore voglia accedere all’indirizzo RAM 65, che in binario è 001000001, esso corrisponde alla seconda cella della prima riga della cache (poiché gli ultimi due bit sono 01 e i successivi quattro sono 0000). Questo metodo fa sì che a ciascun indirizzo possa corrispondere UNA SOLA linea di cache, quindi se lo si vuole caricare bisogna sostituire necessariamente quella linea anche se le altre non sono state usate.  
  ![](data:image/png;base64,iVBORw0KGgoAAAANSUhEUgAAAnAAAAEICAIAAABQ6F7FAAAAAXNSR0IArs4c6QAAAAlwSFlzAAASdAAAEnQB3mYfeAAADVdJREFUeF7t3VFy20YQBNAg59LxdS/ErvykaJZDyb3EYPvlmxzsvBmwixQqPs7z/Mt/BAgQIECAwJ8J/P1nb/duAgQIECBA4KeAQLUHBAgQIEAgICBQA4hKECBAgAABgWoHCBAgQIBAQECgBhCVIECAAAECAtUOECBAgACBgIBADSAqQYAAAQIEBKodIECAAAECAQGBGkBUggABAgQICFQ7QIAAAQIEAgICNYCoBAECBAgQEKh2gAABAgQIBAQEagBRCQIECBAgIFDtAAECBAgQCAgI1ACiEgQIECBAQKDaAQIECBAgEBAQqAFEJQgQIECAgEC1AwQIECBAICAgUAOIShAgQIAAAYFqBwgQIECAQEBAoAYQlSBAgAABAgLVDhAgQIAAgYCAQA0gKkGAAAECBASqHSBAgAABAgEBgRpAVIIAAQIECAhUO0CAAAECBAICAjWAqAQBAgQIEBCodoAAAQIECAQEBGoAUQkCBAgQICBQ7QABAgQIEAgICNQAohIECBAgQECg2gECBAgQIBAQEKgBRCUIECBAgIBAtQMECBAgQCAgIFADiEoQIECAAAGBagcIECBAgEBA4DjPM1BGib0EjuPYqyHdECCwj8DY2NonUGXA926Xp6sJ83uY3kWAwBsExgaqn3zfMH2XIECAAIH9BQTq/jPWIQECBAi8QUCgvgHZJQgQIEBgfwF/Q91/xr/v0N9Q2zdgff9j/+K1vvX/ucKvDyuwekr2ADVWadtAHSs+7R5+JVBh/ju1u9zVt9ixyw854QAC9cUp3OXW85PviwP1MgIECBAg8DsBgWo/CBAgQIBAQECgBhCVIECAAAECAtUOECBAgACBgIBADSAqQYAAAQIEBKodIECAAAECAQGBGkBUggABAgQICFQ7QIAAAQIEAgICNYCoBAECBAgQEKh2gAABAgQIBAQEagBRCQIECBAgIFDtAAECBAgQCAgI1ACiEgQIECBAQKDaAQIECBAgEBAQqAFEJQgQIECAgEC1AwQIECBAICAgUAOIShAgQIAAAYFqBwgQIECAQEBAoAYQlSBAgAABAgLVDhAgQIAAgYCAQA0gKkGAAAECBASqHSBAgAABAgEBgRpAVIIAAQIECBznee6hcBzHHo28uYunCwDzzVNwOQL/CmzzgZwd6MMn0lglgZqd+/2qCdT7zcyJCXQLjA1UP/l2L6buCRAgQCAkIFBDkMoQIECAQLeAQO2ev+4JECBAICSwz99QQyDK/BTwUJI9IEBgrMDYv6EK1LE742AECBAgcCcBP/neaVrOSoAAAQJjBQTq2NE4GAECBAjcSUCg3mlazkqAAAECYwUE6tjROBgBAgQI3ElAoN5pWs5KgAABAmMFBOrY0TgYAQIECNxJQKDeaVrOSoAAAQJjBQTq2NE4GAECBAjcSUCg3mlazkqAAAECYwUE6tjROBgBAgQI3ElAoN5pWs5KgAABAmMFBOrY0TgYAQIECNxJwP8c/07TeudZ/YMz79R2LQIEviQw8x+c8Q31S0P0YgIECBAg8FxAoNoMAgQIECAQEBCoAUQlCBAgQICAQLUDBAgQIEAgIOChpADiliU8lLTlWK9qauYjJFdp/Pe6v95orJ7O5QFqppJAnXBPTTzDLdb3/XBYXjQH9T2oH++aGRUvtrPuZbfYKD/5rlsAlQkQIECgSECgFg1bqwQIECCwTkCgrrNVmQABAgSKBARq0bC1SoAAAQLrBATqOluVCRAgQKBIQKAWDVurBAgQILBOQKCus1WZAAECBIoEBGrRsLVKgAABAusEBOo6W5UJECBAoEhAoBYNW6sECBAgsE5AoK6zVZkAAQIEigQEatGwtUqAAAEC6wQE6jpblQkQIECgSECgFg1bqwQIECCwTkCgrrNVmQABAgSKBARq0bC1SoAAAQLrBATqOluVCRAgQKBIQKAWDVurBAgQILBOQKCus1WZAAECBIoEBGrRsLVKgAABAusEBOo6W5UJECBAoEhAoBYNW6sECBAgsE5AoK6zVZkAAQIEigSO8zyL2tXqywLHcbz8Wi8kQCAm4DP5KeXDJ9JMJYEauw02KyRQNxuodgjsJDAzUP3ku9OO6YUAAQIELhMQqJfRuzABAgQI7CQgUHeapl4IECBA4DIBgXoZvQsTIECAwE4CHkraaZp6IUCAAIHLBHxDvYzehQkQIEBgJwGButM09UKAAAEClwkI1MvoXZgAAQIEdhIQqDtNUy8ECBAgcJmAQL2M3oUJECBAYCcBgbrTNPVCgAABApcJCNTL6F2YAAECBHYSEKg7TVMvBAgQIHCZgEC9jN6FCRAgQGAnAYG60zT1QoAAAQKXCQjUy+hdmAABAgR2EhCoO01TLwQIECBwmYBAvYzehQkQIEBgJwGButM09UKAAAEClwkI1MvoXZgAAQIEdhIQqDtNUy8ECBAgcJmAQL2M3oUJECBAYCcBgbrTNPVCgAABApcJHOd5XnZxF54qcBzH1KM5FwEC7QJjY8s31PbV1D8BAgQIRAQEaoRREQIECBBoFxCo7RugfwIECBCICAjUCKMiBAgQINAu4KGk9g142r+HkqxFUGDsIyTBHr9X6tcbjdUrn0hjlQTq926Ezd/1cJ+PXd83jwHLi+Cgvgf1413utVsHqp98X9x8LyNAgAABAr8TEKj2gwABAgQIBAQEagBRCQIECBAgIFDtAAECBAgQCAgI1ACiEgQIECBAQKDaAQIECBAgEBAQqAFEJQgQIECAgEC1AwQIECBAICAgUAOIShAgQIAAAYFqBwgQIECAQEBAoAYQlSBAgAABAgLVDhAgQIAAgYCAQA0gKkGAAAECBASqHSBAgAABAgEBgRpAVIIAAQIECAhUO0CAAAECBAICAjWAqAQBAgQIEBCodoAAAQIECAQEBGoAUQkCBAgQICBQ7QABAgQIEAgICNQAohIECBAgQECg2gECBAgQIBAQEKgBRCUIECBAgMBxnicFAg8Cx3EwIUDg/QI+kJ+aP3wijVUSqO+/ZW5wRYF6gyE5IoFWgbGB6iff1pXUNwECBAhEBQRqlFMxAgQIEGgVEKitk9c3AQIECEQFBGqUUzECBAgQaBXwUFLr5PVNgAABAlEB31CjnIoRIECAQKuAQG2dvL4JECBAICogUKOcihEgQIBAq4BAbZ28vgkQIEAgKiBQo5yKESBAgECrgEBtnby+CRAgQCAqIFCjnIoRIECAQKuAQG2dvL4JECBAICogUKOcihEgQIBAq4BAbZ28vgkQIEAgKiBQo5yKESBAgECrgEBtnby+CRAgQCAqIFCjnIoRIECAQKuAQG2dvL4JECBAICogUKOcihEgQIBAq4BAbZ28vgkQIEAgKiBQo5yKESBAgECrgEBtnby+CRAgQCAqcJznGS2o2D4Cn5+f+zSjEwIE9hL4+PiY1pBvqNMm4jwECBAgcEsBgXrLsTk0AQIECEwTEKjTJuI8BAgQIHBLAYF6y7E5NAECBAhME/BQ0rSJDDqPh5IGDeP+Rxn4CMkQ1F9vNFZPR/MANVBJoA65pyYeY/76XqKG5UV2UN+D+vGugVHxYi9LXzZ/o/zku3QBFCdAgACBFgGB2jJpfRIgQIDAUgGBupRXcQIECBBoERCoLZPWJwECBAgsFRCoS3kVJ0CAAIEWAYHaMml9EiBAgMBSAYG6lFdxAgQIEGgREKgtk9YnAQIECCwVEKhLeRUnQIAAgRYBgdoyaX0SIECAwFIBgbqUV3ECBAgQaBEQqC2T1icBAgQILBUQqEt5FSdAgACBFgGB2jJpfRIgQIDAUgGBupRXcQIECBBoERCoLZPWJwECBAgsFRCoS3kVJ0CAAIEWAYHaMml9EiBAgMBSAYG6lFdxAgQIEGgREKgtk9YnAQIECCwVEKhLeRUnQIAAgRYBgdoyaX0SIECAwFIBgbqUV3ECBAgQaBE4zvNs6VWfXxT4/Pz84ju8nACBgMDHx0egynYlHj6RBioJ1O2WLteQQM1ZqkSAQFhgYKD6yTc8Y+UIECBAoFNAoHbOXdcECBAgEBYQqGFQ5QgQIECgU0Cgds5d1wQIECAQFvBQUhhUOQIECBDoFPANtXPuuiZAgACBsIBADYMqR4AAAQKdAgK1c+66JkCAAIGwgEANgypHgAABAp0CArVz7romQIAAgbCAQA2DKkeAAAECnQICtXPuuiZAgACBsIBADYMqR4AAAQKdAgK1c+66JkCAAIGwgEANgypHgAABAp0CArVz7romQIAAgbCAQA2DKkeAAAECnQICtXPuuiZAgACBsIBADYMqR4AAAQKdAgK1c+66JkCAAIGwgEANgypHgAABAp0CArVz7romQIAAgbCAQA2DKkeAAAECnQICtXPuuiZAgACBsIBADYMqR4AAAQKdAgK1c+66JkCAAIGwgEANgypHgAABAp0CArVz7romQIAAgbCAQA2DKkeAAAECnQICtXPuuiZAgACBsIBADYMqR4AAAQKdAgK1c+66JkCAAIGwgEANgypHgAABAp0CArVz7romQIAAgbCAQA2DKkeAAAECnQICtXPuuiZAgACBsMA/icn6paSIUGUAAAAASUVORK5CYII=)  
  Il vantaggio è che richiede un solo Tag e un solo circuito comparatore, tuttavia diventa più simile a una RAM in miniatura, quindi è un po’ più lenta e sfrutta meno bene il principio di località.  
  Questo è il polo opposto rispetto alla cache completamente associativa: molto meno costosa ma certo meno efficiente.
* La via di mezzo è la memoria Cache associativa ad insiemi. Essa si basa sui livelli di associatività.  
  Immaginiamo di avere una cache a 256 linee, ognuna delle quali ha un campo tag e 4 celle. Se la memoria fosse completamente associativa avremmo un livello di associatività di 256, e altrettanti comparatori. A un livello di associatività 1, avremmo un solo tag e un solo comparatore, e in questo caso avremmo 2 bit meno significativi per la cella di memoria all’interno della linea (così come per la 256) ma poi avremmo però altri 8 bit in cui è presente l’informazione del numero di linea, lasciando i restanti per il contenuto vero e proprio del Tag.   
  Una via di mezzo è per esempio il livello di associatività 16. Questo significa che ci sono 16 comparatori (e quindi la cache è divisa in 16 parti). Ciascuna delle 16 parti in cui è suddivisa la cache viene trattata come una Cache a Corrispondenza Diretta. C’è quindi un iniziale confronto tra tutti e 16 i Tag e l’indirizzo di memoria e se uno ha un riscontro positivo (notato da una funzione OR) allora la Cache procede a trattare l’informazione presente nella linea e cella corrispondente. Questo è un compromesso perché costruendo tante piccole sotto-cache a corrispondenza diretta il tempo da loro impiegato è molto piccolo.

In genere nel realizzare una Cache non si utilizza la realizzazione completamente associativa (per cache di decenti dimensioni) per via degli elevati costi di quest’ultima.

È abbastanza intuitivo ottimizzare un sistema usando più memorie cache. Infatti è così, c’è addirittura una vera e propria gerarchia di memorie cache, con memorie di livello 1, di livello 2 ecc.

I vantaggi di questa memoria cache su più livelli è quello di cercare di arrivare gradualmente alla memoria RAM dinamica passando attraverso memorie cache a velocità diverse. Si parte da un processore a memoria molto piccola ma estremamente veloce. C’è poi un primo livello di Cache la cui memoria è più grande del processore, ma non gigantesca, ed è di velocità paragonabile al processore (realizzata con una tecnologia quasi completamente associativa). Poi c’è una cache di secondo livello, molto più grande della cache di primo livello, ma decisamente più lenta in quanto la memoria associativa è a insiemi ma a livello di associatività basso. C’è infine la RAM, molto più grande ma più lenta. Idealmente la prima memoria Cache ha dimensione di pochissimi kilobyte, se il processore trova lì i dati che necessita, stonks, altrimenti va a cercare nella cache di secondo livello, dove la probabilità di trovare il dato è più alta ma la velocità rimane comunque molto più alta rispetto alla RAM. Ci possono essere anche più livelli di memorie cache (non è strano trovare un terzo livello).

Bisogna ricordarsi, infine, che tra queste memorie cache e la RAM da qualche parte deve essere inserita anche l’MMU (si trova sicuramente dopo il primo livello e probabilmente dopo il secondo). Il vantaggio di avere la cache prima dell’MMU è quello di evitare il più possibile l’utilizzo del meccanismo di traduzione (specie se l’indirizzo non è ancora presente nel TLB). Quindi i primi due livelli di cache funzionano, come il processore, a indirizzi virtuali. Un eventuale terzo livello potrebbe stare dopo L’MMU e in questo caso il campo Tag funzionerebbe a indirizzo fisico.

Per passare dall’esecuzione di un programma a quella di un altro una delle cose che bisogna fare è svuotare la memoria cache.

Veniamo ora alle operazioni di lettura e scrittura all’interno della cache. Se quando voglio accedere in lettura il dato non è presente nella cache il gestore della cache riconosce la mancanza dell’indirizzo e legge l’indirizzo nella RAM, importando il dato. In questo caso dopo l’accesso in lettura abbiamo due copie del dato (uno in RAM e uno in cache), e se usiamo più livelli possiamo avere ancora più copie (2, 3 o 4). Quando però il processore vuole effettuare delle operazioni di scrittura ci sono più valori tra i quali si deve scegliere quali modificare. Per questo motivo si introduce il protocollo di consistenza. Ce ne sono di due tipi diversi ( o meglio quelli sono quelli che vediamo noi):

* Il più semplice è il Write-Through: quando il processore chiede la scrittura essa avviene sia all’interno della memoria cache, sia all’interno della memoria RAM (si aggiornano quindi tutte le copie e si fa aspettare il processore finché non termina l’operazione). Il vantaggio in questo caso è quello di mantenere la consistenza dei dati, lo svantaggio è che il processore rallenta consistentemente quando effettua un’operazione di scrittura (quindi è come se la cache non ci fosse a migliorare l’efficienza). La giustificazione che si porta tale protocollo è che se si fa l’analisi del comportamento dei programmi reali il numero delle operazioni di scrittura è più piccolo delle operazioni di lettura (in particolare non superano il 25% del totale degli accessi alla memoria RAM). Ergo il rallentamento del protocollo Write-Through si applica solo a ¼ delle istruzioni di accesso.
* L’alternativa è il protocollo Write-Back. Durante la scrittura essa viene considerata terminata quando essa è stata aggiornata nella memoria Cache (senza preoccuparsi della RAM). Per una certa quantità di tempo, quindi, la consistenza non è mantenuta: la copia presente in cache non è più uguale all’originale presente in RAM. Il momento in cui si aggiorna la cella RAM è invece l’ultimo momento utile: cioè quando la cella di memoria cache sta per essere svuotata/sovrascritta. Ricordarsi di ciò è responsabilità del controllore della memoria Cache. Questo velocizza l’operazione di scrittura ma rallenta la sostituzione delle linee di cache. Questa modalità di funzionamento è certamente più efficacie, però richiede una maggiore complessità circuitale, è quindi più costoso da realizzare.

Cosa ha senso mettere al primo livello/al secondo ecc.? Tipicamente al primo livello si preferisce avere dispositivi semplici (ma veloci, almeno in lettura), quindi in genere è realizzata con il protocollo Write-Through. Questo specialmente se è presente un secondo livello e in maniera particolare se (come ci si aspetta) questo presenta un protocollo del tipo Write-Back (per non rallentare troppo le operazioni di scrittura del processore).

Quindi in generale i livelli superiori di Cache sono più complicati e sono di dimensioni superiori, quindi si dovrebbe presentare meno frequentemente (rispetto al primo livello) il problema della sostituzione della linea di Cache (che è ciò che fa rallentare il Write-Back).

C’è un altro piccolo problema da tenere in conto, legato alla realizzazione di sistemi con più processori. Un sistema moderno è basato su processori multi-core. Vi è quindi più di una CPU, ognuna delle quali ha la propria gerarchia di cache. In genere ogni cache è dotato della sua personale cache di primo livello, solo a livelli più alti le cache sono condivise. Un processore a più core può quindi causare ulteriori problemi di consistenza: per esempio se un core modifica una cella di memoria e un altro prova poi ad accedervi. Nell’esempio proposto ci è una differenza tra il valore salvato nelle cache di alto livello/RAM e quello presente nelle cache di primo livello dei processori.   
Questo è un tipo di problema è molto più complicato da risolvere.